[livres divers classés par sujet] [Informatique] [Algorithmique] [Programmation] [Mathématiques] [Hardware] [Robotique] [Langage] [Intelligence artificielle] [Réseaux]
[Bases de données] [Télécommunications] [Chimie] [Médecine] [Astronomie] [Astrophysique] [Films scientifiques] [Histoire] [Géographie] [Littérature]

Statistikpropagation und Kostenschätzung für Anfragesequenzen

contributor IPVS, Anwendersoftware
Senden Sie eine e-Mail an
creator Müller, Thorsten
date 2005-04-29
description 106 pages
Aufgabe dieser Diplomarbeit ist es, die theoretischen Grundlagen für die Propagation von Statistiken und Kardinalitätsschätzwerten innerhalb von Datenbankanfragen und zwischen einzelnen Anfragen einer Anfragesequenz zu erarbeiten. Im Rahmen dieser Arbeit gilt eine Anfragesequenz als eine Folge von Anfragen, die eine Fragestellung berechnen, die zu komplex ist um noch sinnvoll in einer einzelnen Anfrage ausgeführt zu werden. Innerhalb dieser Sequenz kann jede Anfrage auf die Ergebnisse vorangegangener Anfragen aus der Sequenz zugreifen. Eine einzelne Anfrage stellt nur einen Berechnungsschritt zum Gesamtergebnis dar, dessen Ergebnis in einer temporären Tabelle abgespeichert wird, die nach Abarbeitung der Anfragesequenz wieder gelöscht wird. Heutige Datenbanksysteme können zwar bereits die Kosten und die Kardinalität des Ergebnisses einzelner Anfragen abschätzen, jedoch nicht für eine Anfragesequenz, die mehrere voneinander abhängige Anfragen enthält. Dies liegt daran, dass es keine entsprechende Schnittstelle für die Kostenabschätzung solcher Statement-Folgen gibt. Darüber hinaus werden bisher nur die Kosten und die Ergebniskardinalität, nicht aber die Werteverteilung des Ergebnisses abgeschätzt und propagiert. Jeder neue Berechnungsschritt greift wieder auf die unveränderten Basistabellen zurück. Um die Propagation der kompletten Statistiken zu ermöglichen wurde in dieser Arbeit ermittelt, welche statistischen Verfahren zur Approximation der Datenverteilung in relationalen Datenbanken existieren. Für das weitverbreitetste dieser Verfahren, den Histogrammen wurden Algorithmen entwickelt um diese Statistiken verarbeiten und verknüpfen zu können.
format application/pdf
1625921 Bytes
identifier  http://www.informatik.uni-stuttgart.de/cgi-bin/NCSTRL/NCSTRL_view.pl?id=DIP-2277&engl=1
language ger
publisher Stuttgart, Germany, Universität Stuttgart
relation Diploma Thesis No. 2277
source ftp://ftp.informatik.uni-stuttgart.de/pub/library/medoc.ustuttgart_fi/DIP-2277/DIP-2277.pdf
subject Database Management Systems (CR H.2.4)
Probability and Statistics (CR G.3)
Anfrageoptimierung
Datenbankstatistiken
Datenbanksysteme
Histogramme
Kostenschätzung
Kardinalitätsschätzung
Statistikpropagation
SQL
title Statistikpropagation und Kostenschätzung für Anfragesequenzen
type Text
Diploma Thesis